統計、疫学、健診結果の解析、
4分割表、2x2
精度、
感度=真陽性率、
特異度=真陰性率、有効度、
陽性適中度=
陽性予測値、
検査前Odds、
有病率=検査前P、
有効度、
陽性尤度比、
検査後Odds、
検査後確率、
Odds比、
信頼区間、
相対危険度、
ROC曲線による基準値の設定、
層別尤度比、SSLR
2x2、独立性の検定、関連の有無、差の検定、その検査の有効性の検定(χ2, Yates, Fisher)、
2種類の独立性の検定、2種類の差の検定、2種類の検査の優劣の検定(McNemar)、
2種類の検査の一致度の比較検定、
測定値の分布が母集団分布(理論分布、期待値)と適合しているか否かの検定
検定法の選択フロ−チャ−ト
統計上で注意すべきこと、バイアス、交絡
|
以下、統計に関して、大分しつこく記載した。理由は、誰でも、客観的に納得できるからである。専門家でなければ解決できないという信仰を取り除き、猫にでもわかるような内容を目指している:
(A)検査の性能評価の指標
技術的評価
施行特性
費用便益 cost-benefit
簡易性 simplicity
受容性 acceptability
侵襲性が低く、患者から受け入れやすい
安全性
測定特性
正確性 accuracy
真値に近いこと。正確には、信頼区間 confidence interval=p±1.96√(pq/n)で表現することが必要である(ただし、p確率、q=1-p、n標本数)。仮にp=0.2として、n=10の時p=-0.05〜0.45、n=100でp=0.12〜0.28、n=1000でp=0.18〜0.22、n=10000でp=0.20〜0.21となり、標本数が多いほど良いことがわかる。
精度 precision、再現性 repeatability
変動が少ない。標準偏差が小さいほど精度が高い。
検出限界
診断的評価
診断特性
有病率 prevalence、検査前確率 pretest probability
=D+/全例
=(a+c)/(a+b+c+d)
注意:効率、予測値は有病率の影響を受けやすい
感度、真陽性率 sensitivity
特異度、真陰性率 specificity
偽陽性率 false positive value
偽陰性率 false negative value
効率 efficacy、有効度 validity
=(真陽性数+真陰性数/全例
=(a+c)/(a+b+c+d)
陽性予測値 positive predictive value、陽性反応適中度 predictive value of positive test //特異度 因って、特異度は診断基準rule inの指標となる
陰性予測値 negative predictive value、陰性反応適中度 predictive value of negative test//感度 因って、感度は除外基準rule
outの指標となる
陽性尤度比 lilelihood ratio of positive result, LR+
=感度/偽陽性率
=感度/(1−特異度)
陰性尤度比 likelihood ratio of negative reuslt, LR-
=偽陰性率/特異度
=(1−感度)/特異度
尤度比 likelihood ratio, LR
=P(X|D+)/P(X|D-)
X:ある検査結果
D:疾患
ROC分析
有用性
費用効用分析 cost utility analysis (CUA):
(期待)効用値 (expected) utility value、生活の質 quality of life (QOL):
1 完全な健康状態
中間値
0 死亡
説明 以下の表ように仮定すると、
(1) 曝露の効果をコホート(prospective、最初に曝露・非曝露などの2群に分け、追跡調査を行い、疾患の発生を経時的に調査する。時間とお金がかかるのが欠点)調査で判定した時:
リスク比=曝露群リスク/非曝露群リスク={a/(a+b)}/{(c/(c+d)}
(2) 曝露の効果を患者ー対照(ケースーコントロール、retrospective、時間に逆行するする様式で、患者群と某対照群を遡って調べる。安上がりで安直であるが、バイアスや交絡の危険が高い)調査で判定した時や、検査の有効性を判定したい時:
オッズ比=陽性群内の(患者/非患者)比/陰性群内の(患者/非患者)比=(a/b)/(c/d)
具体的に、検査の有効性について求めてみると:
検査前Odds=(a+c)/(b+d)
有病率=検査前p=(a+c)/(a+b+c+d)
感度 ST, sensitivity=真陽性率= a/(a+c)
特異度 SP, specificity=真陰性率=d/(b+d)
検査後確率p’=陽性予測値 PVP, predictive value of positive test=a/(a+b)、//特異度、有病率、rule in検査
陰性予測値=陰性適中率 PVN=d/(c+d)、//感度、有病率、rule out検査
有効度 validity、妥当性、効率=(a+d)/(a+b+c+d)
陽性尤度比 LR+, likelihood ratio of positive result=感度/偽陽性率=感度/(1−特異度)=[a/(a+c)]/[b/(b+d)]、
<0.1または10<の場合に有効と判断される
陰性尤度比 LR-, likelihood ratio of negative result=偽陰性率/特異度=(1-感度)/特異度=[c/(a+c)]/[d/(b+d)]
尤度比 LR, likehoood ratio=p(陽性/病気+)/p(陽性/病気-)
検査後Odds'=Odds x LR=a/b
検査後確率 p'=Odds'/(1+Odds')=a/(a+b)
Odds比=(a/b)/(c/d)
Odds比の90%, 95%, 99% 信頼区間=e exp[ln OR±k√(1/a + 1/b + 1/c + 1/d)]、k=1.65
(90%), 1.96 (95%), 2.58 (99%)、判定では、1が含まれないと有意とされる。
ケース・コントロール研究(=後向き研究)とオッズ比
糖尿病患者51人と糖尿病でない人149人に対して, スポーツの好き嫌いを調査したところ,
表3.3.2
糖尿病とスポーツの関係 |
疫学研究から得られるクロス表 |
スポーツ |
糖尿病
患者 |
糖尿病
でない人 |
計 |
嫌い |
35 |
65 |
100 |
好き |
16 |
84 |
100 |
計 |
51 |
149 |
200 |
|
曝露 |
疾病発生 |
計 |
あり |
なし |
あり |
a |
c |
n |
なし |
b |
d |
m |
計 |
t |
s |
N |
|
となったとしよう. このように,
観察期間が終了した時点で, 観察期間中に疾病を発生したコホートメンバーからの ランダムサンプル(=ケースグループ)と
観察終了時までに疾病を発生していないメンバーからの ランダムサンプル(=コントロールグループ)について 過去の曝露記録を比較する研究を ケースコントロール研究という. (疫学研究の1つ)
上述のケースコントロール研究で調査したいことも,
"スポーツの好き嫌いが糖尿病罹患の危険因子であるか?"
であるが, この場合行側の合計 ( n, m ) には, 全く意味が無い. そこで, 曝露効果を定量的に調べるときの指標として,
リスク比のかわりに, 次の オッズ比OD(odds ration)を利用する:
|
上の例では, |
. |
リスク比とオッズ比の関係と検定
曝露グループ・非曝露グループともに疾病発生割合が非常に小さい場合 (a ≪ c , b≪d)
i.e.
オッズ比により近似的にリスク比を推定することができる.
コホート研究・ケースコントロール研究のどちらを行うにしても, バイアスを生じさせないためには,
実験計画におけるデザインを 十分に熟慮する必要がある. その上で, バイアスによる誤った判断はほぼないと考えられる場合,
独立性の検定(χ自乗検定・Fisherの正確確率)により 実験結果から偶然性を棄却できるかどうかを判定する. そして, 次の信頼区間の推定へと進む.
|
信頼区間 (信頼係数(1-α)%)
オッズ比
すべてのセル (a,b,c,d) が大きいとき, 近似的に
なので
.
もとのスケールに戻して,
.
になる.
リスク比、相対危険度=[(a/a+b)]/[c/(c+d)]
リスク比の90%, 95%, 99% 信頼区間=e exp[ln OR±k√{(1-a/(a+b))/a + (1-c/(c+d)/c}]、k=1.65 (90%), 1.96 (95%), 2.58 (99%)、判定では、1が含まれないと有意とされる。
コホート研究(=前向き研究)とリスク比(=相対リスク)
スポーツ嫌い100人とスポーツ好き100人を10年間追跡し, 糖尿病に罹患するか否かを調査したところ,
表3.3.1
スポーツと糖尿病の関係 |
疫学研究から得られるクロス表 |
スポーツ |
糖尿病
罹患 |
糖尿病
非罹患 |
計 |
嫌い |
35 |
65 |
100 |
好き |
16 |
84 |
100 |
計 |
51 |
149 |
200 |
|
曝露 |
疾病発生 |
計 |
あり |
なし |
あり |
a |
c |
n |
なし |
b |
d |
m |
計 |
t |
s |
N |
|
となったとしよう. このように,
研究開始時に研究対象としている疾病(糖尿病)にかかっておらず, 将来その疾病にかかる可能性がある対象者の集団(リスク集団)を追跡調査し,
研究期間中に起きた疾病発生数を数え上げる研究を コホート研究という. (疫学研究の1つ)
上述のコホート研究で調査したいことは,
"スポーツの好き嫌いが糖尿病罹患の危険因子であるか?"
である. この曝露効果を定量的に調べるときに用いる指標として,
“リスク差RD(risk difference) = 絶対リスク(absolute
risk)” と
“リスク比RR(risk ratio) = 相対リスク(relative
risk)” がある. リスク差は,
|
上の例では, |
, |
リスク比は,
|
上の例では, |
|
である.
リスク差は曝露による疾病発生リスクの絶対的な増加を, リスク比は曝露による疾病発生リスクの相対的な増加を表している.
(困難ではあるが)バイアスが殆ど存在しないと仮定できるとき, “RR=2.19”はスポーツ嫌いな人はスポーツ好きな人に比べて
糖尿病になる確率が2.19倍であるみなせる.
信頼区間 (信頼係数(1-α)%)
リスク比
すべてのセル (a,b,c,d) が大きいとき, 近似的に
なので
. もとのスケールに戻して,
. になる.
具体的に:SLE診断における2種類の検査にの比較について:
(1)FANA |
(2)抗Sm抗体 |
|
検査陰性 |
検査陽性 |
|
SLE |
1 |
99 |
|
正常 |
80 |
20 |
|
|
|
|
|
感度=真陽性率=99%
特異度=真陰性度=80%
陽性尤度比=LR+=4.95
陰性尤度比=LR-=0.0125
SLEの検査前確率=0.1%とすると:
上記:
感度=真陽性率=99%
特異度=真陰性度=80%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
0.1 |
9.9 |
10 |
正常 |
7992 |
1998 |
9990 |
|
7992.1 |
2007.9 |
10000 |
陽性適中率=9.9/2007.9=0.0049
SLEの検査前確率=5%とすると:
上記:
感度=真陽性率=99%
特異度=真陰性度=80%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
5 |
495 |
500 |
正常 |
7600 |
1900 |
9500 |
|
7605 |
2395 |
10000 |
陽性適中率=495/2395=0.207
偽陰性検査後確率=5/7605=0.0007
SLEの検査前確率=50%とすると:
上記:
感度=真陽性率=99%
特異度=真陰性度=80%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
50 |
4950 |
5000 |
正常 |
4000 |
1000 |
5000 |
|
4050 |
5950 |
10000 |
陽性適中率=4950/5950=0.83
|
|
検査陰性 |
検査陽性 |
|
SLE |
70 |
30 |
|
正常 |
99 |
1 |
|
|
|
|
|
感度=真陽性率=30%
特異度=真陰性度=99%
陽性尤度比=LR+=30
陰性尤度比=LR-=0.707
SLEの検査前確率=0.1%とすると:
上記:
感度=真陽性率=30%
特異度=真陰性度=99%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
7 |
3 |
10 |
正常 |
9890 |
100 |
9990 |
|
9897 |
103 |
10000 |
陽性適中率=3/10=0.029
SLEの検査前確率=5%とすると:
上記:
感度=真陽性率=30%
特異度=真陰性度=99%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
350 |
150 |
500 |
正常 |
9405 |
95 |
9500 |
|
9755 |
245 |
10000 |
陽性適中率=150/245=0.612
偽陰性検査後確率=350/9755=0.036
SLEの検査前確率=50%とすると:
上記:
感度=真陽性率=30%
特異度=真陰性度=99%
と同様な条件では、検査1万人において、
|
検査陰性 |
検査陽性 |
|
SLE |
3500 |
1500 |
500 |
正常 |
4950 |
50 |
5000 |
|
8450 |
1550 |
10000 |
陽性適中率=1500/1550=0.968
|
感度//スクリーニング// SnNout疾患否定。すなわち、スクリーニングに使用されるべきである。 |
特異度//SpPin疾患支持。すなわち、疾患確率を上げた上で、確定診断として使用すべきである。
|
(B)ある検査の閾値(基準値、cut-off値、効率的なレベル)の設定:
(B-1)ROC (receiver operating characteristic curve)曲線より、感度と特異度を読み取り、Cut-off値(病態識別値)の決定:
曲線が、左上角に近いほど、良好と判断される。
本来的には、費用効用効率・効用値の視点からは、最左上地点や45度接点の選択が最適とはならない。最適なcut-off値(病態識別値)は、有病率と陽性、陰性の場合の効用値の大きさによって決定されるべきである。P(D):有病率、C:コスト(効用値)、TN:真陰性、FP:偽陽性、TP:真陽性、FN:偽陰性とすると、求めるべき接線の傾き=[{1-P(D)}/P(D)]x[{C(TN)-C(FP)}/{C(TP)-C(FN)}]となる。
(B-2)層別尤度比 stratum-specific likelihood ratio (SSLR), 多段階尤度比 multi-level
likelihood ratioによるCut-off値(病態識別値)の決定:
cut off値を設定する為には、ROCの接線の傾きを調べることが良い。が、表から求める場合、一般に両極端の明瞭な陽性例と陰性例が多い場合に、単純な2x2分割表の感度・特異度・尤度比は境界部分の判定に悪影響を及ぼす。その防止として、多層分割にして、両極端の症例数を補正する方法は当を得ており、ROC図の原点または右上の点とcut
off値を結んだLRの傾きを、接線の傾きに補正する役割を果たしている。
例:鉄欠乏性貧血の血清フェリチン値による診断について、下表のごとくに、2x2分割表による検査後確率よりも、多層分割による検査後確率の方が、より診断精度を反映している:
|
検査結果 |
疾患 |
2x2分割表 |
多層分割 |
|
血清フェリチン |
鉄欠乏性貧血 |
感度 |
特異度 |
陽性尤度比 |
陰性尤度比 |
検査後確率 |
層別尤度比
SSLR |
検査後確率 |
|
mg/dl |
cut off |
陽性症例数nx |
陰性症例数
ny |
Σnx/NX |
Σny/NY |
LR+ |
LR- |
検査前確率=0.5として |
(nx/NX)/
(ny/NY) |
検査前確率=0.5として |
n1 |
<15 |
|
474 |
20 |
|
|
|
|
|
(474/809)/
(20/1770)
=52 |
0.98 |
|
|
15 |
|
|
474/809
=0.59 |
1750/1770
=0.99 |
52 |
0.42 |
0.98 |
|
|
n2 |
<35 |
|
175 |
79 |
|
|
|
|
|
(175/809)/
(79/1770)
=4.8 |
0.83 |
|
|
35 |
|
|
649/809
=0.8 |
1671/1770
=0.94 |
14 |
0.2 |
0.93 |
|
|
n3 |
<65 |
|
82 |
171 |
|
|
|
|
|
(82/809)/
(171/1770)
=1 |
0.5 |
|
|
65 |
|
|
731/809
=0.9 |
1500/1770
=0.85 |
6 |
0.11 |
0.86 |
|
|
n4 |
<95 |
|
30 |
168 |
|
|
|
|
|
(30/809)/
(168/1770)
=0.39 |
0.28 |
|
|
95 |
|
|
761/809
=0.94 |
1332/1770
=0.75 |
4 |
0.08 |
0.8 |
|
|
n5 |
95≦ |
|
48 |
1332 |
|
|
|
|
|
(48/809)/
(1332/1770)
=0.08 |
0.07 |
N |
合計 |
|
NX
809 |
NY
1770 |
|
|
|
|
|
|
|
おまけ:SSLRの95%信頼区間の求め方:
NX:有疾患総数、NY:無疾患総数、nk+:k層における有疾患症例数、nk-:k層における無疾患症例数とすると、
VAR(ln SSLR)= 1/(nk+ +0.5) − 1/(NX +0.5) + 1/(nk- +0.5) − 1/(NY +0.5)で、
95%信頼区間=e^{ln SSLR ± 1.96√(VAR(ln SSLR)}となる。
ところで、上表の2分割LR+とSSLRのグラフを描くと、下図のようになる:
上図より、SSLRで検討した方が、2分割で検討するよりも、より実際のLR+を反映していることが理解できる。
(C) mxn クロス表 (cross table, 分割表 contingency table)の検定:
(C-1)2群の母比率の差の検定
群 |
標本数 |
陽性数 |
陽性率% |
1 |
n1=236 |
r1=10 |
p1=(r1/n1)x100=4.2 |
2 |
n2=94 |
r2=11 |
p2=(r2/n2)x100=11.7 |
計 |
N=330 |
R=21 |
p=(R/N)x100=6.4 |
陽性率に差があるか否か、有意水準5%で検定する:
帰無仮説Ho:p1=p2
対立仮説H1:p1とp2は等しくない
有意水準α=0.05(5%)
検定統計量Z0を求める:
| p1-p2 |- {(1/n1) + (1/n2)}/2
Z0=
√[p(1-p){(1/n1) + (1/n2)}]
=2.263より、
P=0.02382<α=0.05より、
Hoは棄却される。すなわち、両群の陽性率には差が認められる。
(C-2) mxn クロス表 (cross table, 分割表 contingency table)の検定:
(C-2-1) 対応の無いmxn クロス表 (cross table, 分割表 contingency table)の検定:
対応の無いとは:(1)厳格には、「同一で無い症例に検査を実施して、検査の優劣を比較する」ような場合であるが、(2)交絡・バイアス因子を排除する為に、厳格に、年令階級や性などを一致させていないunmatched
pairsの症例群を比較する場合とする:
(C-2-1-1) 対応の無いmxn クロス表 (cross table, 分割表 contingency table)の検定:
検定前の準備:
自由度=(m-1)x(n-1)、例:3x3クロス表の自由度=(3-1)x(3-1)=4
期待度数:
(1) 求め方
属性A/属性B |
1 |
2 |
計 |
1 |
a11
実測度数 9
期待度数 E11=m1xn1/N=6.9 |
a12
2
4.1 |
n1
11 |
2 |
a21
3
5.1 |
a22
5
2.9 |
n2
8 |
計 |
m1
12 |
m2
7 |
N
19 |
(2) 応用:
(2-1)Nが大きく、8割以上のセルの期待度数が5以上の時は、χo^2検定、
(2-2)中間の時は、 χo^2検定にYates修正項を加えて (Yates;イエ−ツ、アイルランド人)、
(2-3)N≦20か、6割以上のセルの期待度数が5以下の時は、 Fisher直接確率法(Fisher's exact probability
method)で、検定する。
事例:独立か否かについての検定:
帰無仮説Ho:独立(無関係)、
対立仮説H1:独立でない(関係がある)、
有意水準α=0.05(5%)
自由度=(2-1)(2-1)=1
検定統計量を求める:
その検査が有効(validity)か否かの評価:
結果:
感度=0.575
特異度=0.267
有効度=0.49 (感度と特異度の中間値を示す)
仮説
帰無仮説=H0=感度+特異度=1
対立仮説=H1=1<感度+特異度
手技
χ0^2 検定:通常の検定の場合、
χ0^2 = (23x4-11x17)^2 x55/34x21x40x15
Yates (イエーツ、アイルランド人)の修正項:
χy^2 = (|23x4-11x17| - 55/2)^2 x55/34x21x40x15 = 0.585 < χy^2 (0.05) = 3.841
∴ H0 無効
(C-2-1-2) 対応の無いmxn クロス表 (cross table, 分割表 contingency table)の検定:
Fisherの直接確率法:
関係があるかどうかを、有意水準5%で検定する:2セルで期待度が5以下なのでFisherで検定する、
属性A/属性B |
1 |
2 |
計 |
1 |
a11
実測度数 9
期待度数 E11=m1xn1/N=6.9 |
a12
2
4.1 |
n1
11 |
2 |
a21
3
5.1 |
a22
5
2.9 |
n2
8 |
計 |
m1
12 |
m2
7 |
N
19 |
周辺度数を固定し、実測度数の最小値をxとして、x、x-1、x-2、x-3、・・・・・を繰り返し、x=0になるまで行う。xが決まると残りの3セルの値は自動的に決まる:
属性A/属性B |
1 |
2 |
計 |
1 |
a11
実測度数 10 |
a12
1 |
n1
11 |
2 |
a21
21 |
a22
6 |
n2
8 |
計 |
m1
12 |
m2
7 |
N
19 |
属性A/属性B |
1 |
2 |
計 |
1 |
a11
実測度数 11 |
a12
0 |
n1
11 |
2 |
a21
1 |
a22
7 |
n2
8 |
計 |
m1
12 |
m2
7 |
N
19 |
帰無仮説Ho:独立、関係なし、
対立仮説H1:独立でない、関係がある
有意水準α=0.05(5%)
確率の計算:
m1!m2!n1!n2!
P= より、
N! a!b!c!d!
P(x=2)=0.0611
P(x=1)=0.0061
P(x=0)=0.0002
∴P=P(x=2)+P(x=1)+P(x=0)=0.0674
判定: 対立仮説より、本検定は両側検定となるので、P値を2倍にして、2P=0.1348>α=0.05より、有意水準5%で、Hoは棄却できない。すなわち、差はない(独立である)。
(C-2-1-3) 対応の無い層別解析mxn クロス表 (cross table, 分割表 contingency table)の検定:
mxnのクロス表での適合度の検定:
某小集団の血液型分布の実測値は、理論的分布(期待値)と適合するか(適合度の検定):
H0=帰無仮説、両分布は等しい
H1=対立仮説、両分布は異なる
α=有意差、0.05=5%
自由度=df=(4-1)(2-1)=3
χ0^2 = (55-44)^2/44 + (14-22)^2/22 + (35-33)^2/33 + (6-11)^2/11=8.053
判定: 自由度=(2-1)(4-1)=3、
χo^2=8.053>χ^2(df=3, p=0.05)=7.815
Hoは棄却される。すなわち、有意水準5%で両分布は等しいとはいえない。
(C-2-2) 対応の有るmxn クロス表 (cross table, 分割表 contingency table)の検定:
対応の有るとは:(1)厳格には、「同一症例に異なる検査を実施して、検査の優劣を比較する」ような場合であるが、(2)交絡・バイアス因子を排除する為に、厳格に、年令階級や性などを一致させたmatched
pairsの症例群を比較する場合とする:
二種類の検査(T1、T2)の優劣:
McNemar マクニマー検定
測定値
T1 感度=28/40=0.7
特異度=13/15=0.867
T2 感度=23/40=0.575
特異度=4/15=0.267
二種類の検査方法の結果が一致しているかどうかは、上表より、両検査結果の一致しない部分の比較によって検定する。すなわち、一致度が高ければ、両検査の不一致部分の2セル間(T1陽性かつT2陰性、または、T1陰性かつT2陽性)の患者陽性率(感度)と正常陰性率(特異度)は一致するはずである。したがって、検定式は通常のχ~2ではなく、Yatesの修正項
- (N/2)と同様に、正規分布への近似を高める為に、 -1で補正したMcNemar(マクニマ−、省略:MN)の検定式を用いる:
χMN^2=(|b-c| -1)^2 / (b+c)
判定手順:(1)感度の比較、(2)特異度の比較
患者と判定できる検査であるか否か=二種類の検査の感度の一致度の比較検定:
χMN^2 = (|10-15|-1)^2/(10+15)=0.640 < 3.841 = χ^2 (0.05)
∴ 感度に関して、両検査の間には、有意差無し。
正常と判断できる検査であるか否か=二種類の検査の特異度の一致度の比較検定:
χMN^2 = (|11-2|-1)^2/(11+2)=4.923 > 3.841 = χ^2 (0.05)
∴ 特異度に関して、両検査の間には、有意差がある。
∴ 両検査は、感度には差が無いが、特異度でT2が優れているので、T2による検査が優れている。
実際の、統計処理の手順 (1) 新潟大衛生学 遠藤和男・山本正治方式:
医統計テキスト、西村書店、1992、新潟.
量的デ−タ:
平均値、標準偏差を求めた1へ |
1 |
デ−タは1種類 |
○ |
母平均は既知 |
○ |
母分散 |
既知 |
母平均と標本平均との比較
正規分布 |
不明 |
t分布 |
× |
2群に分けられる |
|
別な群の平均を求める |
○ |
3へ |
× |
文献,過去のデ-タを他の群と考えて、3へ
|
× |
|
|
|
|
2へ |
2 |
組または対のデ−タか |
○ |
前後差のデ-タ |
○ |
正規性 |
○ |
2つの標本平均の比較
対応のあるt検定 |
× |
ウイルコクソンの符号付順位和検定 |
× |
正規性 |
○ |
相関と回帰
ピアソンの相関係数 |
× |
スピアマンの順位相関係数 |
× |
|
|
|
|
3へ |
3 |
平均値は2つだけ |
○ |
正規分布 |
○ |
等分散性(等分散のF検定) |
○ |
2つの標本平均の比較
ステュ−デントのt検定 |
× |
ウエルチのt検定 |
× |
|
|
マン・ホイットニ−のU検定、(ウイルコクソンの順位和検定) |
× |
|
|
|
|
4へ |
4 |
kxl表におさまる |
○ |
正規分布 |
○ |
正規性(分散の一様性:バ−トレットの検定) |
○ |
多数の標本平均の比較(分散分析法):
一元配置法 |
× |
クラスカル・ウオリアスの順位検定 |
× |
正規性 |
○ |
繰り返しのない二元配置法 |
× |
フリ−ドマンの順位検定 |
× |
|
|
|
|
多元配置分散分析法 |
質的デ-タ:費率%を求めたら1へ |
1 |
デ-タは1種類 |
○ |
母平均は既知 |
○ |
nP≧5 |
|
簿比率と標本比率の比較:
正規近似式 |
nP<5 |
n<50 |
F検定式 |
n≧50 |
ポアソン近似 |
× |
2群に分けられる |
|
別な群の比率を求める |
○ |
2群または3群に分けて2へ |
× |
文献,過去のデ-タを他の群と考えて、2へ |
× |
|
|
|
|
2へ |
2 |
2x2表 |
○ |
表の数は1つ |
○ |
対応 |
あり |
2つの標本の比較:
マクニマ−法(マッチド・ペア) |
なし |
期待値<5でフィツシャ−の直接確率法、5≦でカイ2乗検定 |
× |
|
|
多数の標本比率の比較:
マンテル・ヘンツェル法 |
× |
1xl表 |
○ |
季節性 |
○ |
ロジャ−ズ法 |
× |
カイ二乗適合度検定(コルモゴロフ・スミルノフ検定) |
× |
|
|
3へ |
3 |
kx2表、2xl表 |
○ |
患者ー対照研究 |
○ |
オッズ比(kまたはlが順序尺度) |
○ |
マンテル・エクステンション法 |
× |
リジット解析 |
× |
順序尺度 |
○ |
カイ二乗傾向式 |
× |
カイ二乗簡便式→2x2表に落とす |
× |
kxl表 |
両方とも名義尺度 |
○アンケート調査等 |
カイ二乗一般式、2xl表に落とす |
× |
順序尺度の時は、リジットの組み合わせ |
順序尺度でない時は、多変量解析法へ |
実際の、統計処理の手順 (2) 改訂猫田方式:
実際の、統計処理の手順(0):目的から見た検定法の選択方法
1 |
元データの特徴、1群の検定 |
2 |
比較、対応のあるデータ(関連のある、繰り返し、被験者内要因) |
3 |
比較、対応のないデ−タ(関連のない、被験者間要因) |
4 |
比較、交絡因子を考慮する |
5 |
関連 |
6 |
予測 |
7 |
より少ない因子に要約 |
8 |
生存率、打ち切りデ−タ有り |
|
実際の、統計処理の手順(1):デ−タをまとめる:
量的デ−タ |
傾向確認 |
カテゴリ−に分けて▼ |
|
|
度数分布表 |
|
|
ヒストグラム(棒グラフ) |
|
正規性確認 |
正規確率紙 |
|
|
Shapiro-WilkのW統計量 |
|
|
Kolmogorov-SmirnovのD検定統計量 |
|
|
歪度、尖度 |
|
変数変換 |
正規性・等分散近似目的、検定前提のグラフによる明瞭化 |
|
代表値算出 |
正規性・等分散近似目的、検定前提のグラフによる明瞭化 |
|
散布度算出 |
正規分布時は標準偏差 |
|
|
質的デ−タや正規分布でない時は、第1四分位値、第3四分位値、四分位偏差◆ |
|
母集団の区間推定(95%信頼区間(CI)) |
50≦標本数:m±1.96xsem、標本数≦50:m±(自由度n-1のt 0.025)xSEM★ |
|
検定 |
1群の平均値の検定(母平均・標準偏差が既知の母集団との相違)▲ |
質的デ-タ |
代表値算出 |
質的デ−タ時は、順序尺度では中央値 median、名義尺度では最頻値 mode |
|
散布度算出 |
第1四分位値(数)、第3四分位値(数)、四分位偏差◆ |
|
検定 |
1群の比率の検定(2項検定) |
|
1▼ |
先行研究を参考にして、最大値〜最小値より階級数=√(サンプル数) |
|
|
+1で階級幅を作成する |
|
2★ |
sem |
標準誤差=標準偏差/√n=√(pq/n) |
|
SEM |
標準誤差=√(不偏分散/n) |
3◆ |
箱ひげ図 |
|
|
最小値 |
ひげの下端で、箱下面の第1四分位より-1.5x四分位偏差、標準偏差上-1.69の部位、下側確率5% |
|
第1四分位値 |
標準偏差上、-0.68の部位、下側確率25% |
|
第2四分位値 |
中央値 |
|
第3四分位値 |
標準偏差上、+0.68の部位、上側確率25% |
|
最大値 |
ひげの上端で、箱上面の第3四分位より+1.5x四分位偏差、標準偏差上+1.69の部位、上側確率5% |
4▲ |
表記法による区別: |
|
|
平均 |
母集団μ、標本m |
|
差 |
母集団δ、標本d |
|
標準偏差 |
母集団σ、標本s, SD |
|
分散 |
母集団σ2、標本v, V |
|
相関係数 |
母集団ρ、標本r |
実際の、統計処理の手順(2):対応のあるデ−タの比較
要領よく |
賢い近道 |
対応のある前後値の差を改めて変数とする |
|
t検定, (共)分散分析 (AN(C)OVA) |
2群 |
対象 |
同一患者の異なる2時点の測定 |
|
|
|
|
同一患者の異なる2検査の同時測定 |
|
|
|
|
「マッチング」した患者と対照 |
|
|
|
量的デ−タ |
パラメトリック(正規性・等分散) |
|
(対応のある)1標本t検定 |
|
|
ノンパラメトリック(正規性・等分散でない) |
|
Wilcoxon符号付順位和検定 |
|
質的デ−タ |
2x2 |
|
McNemar検定、符号 |
|
|
順序尺度で3カテゴリ−以上 |
|
Wilcoxon検定、符号 |
3群≦ |
対象 |
同一患者の異なる3時点の測定 |
|
|
|
|
同一患者の異なる3検査の同時測定 |
|
|
|
量的デ−タ |
パラメトリック(正規性・等分散) |
例:全校生徒が、全員それぞれ春夏秋冬の決まった日時に連続してHbを測定 |
(繰り返しの無い)二元配置分散分析(2-way ANOVA=対応のある一元配置分散分析 1-way ANOVA)+有意時多重比較(post hoc test)で差異群を検出 |
|
質的デ−タ |
ノンパラメトリック |
順序尺度 |
Friedman (分散分析ではない)、Kendall |
|
|
|
名義尺度 |
Cochran Q検定、lxm |
実際の、統計処理の手順(3):対応のない群間の比較(交絡因子を除外できた場合)
適応:
群同士で、年令・性・関連事項の分布が等しい(マッチング)こと:すなわち、バイアスの1つである、
交絡因子が取り除かれていなければならない:
無作為割付
無作為割付でないとき:
マッチングしているかどうか、諸条件について、その分布を比較しておく
更に、デ−タ自体の正規性についても確認し:
群ごとの正規性(または症例数(25〜)30≦で代用)・等分散によるパラメトリックの採用、
非正規性または質的変数におけるノンパラメトリイクの採用
質的デ−タ、2群間 |
2区分(クラスター) |
|
χ2検定(データ値≦10:Yates補正、データ値≦3:Fisher直接確率)、残差分析 |
|
名義変数で3区分以上 |
|
χ2検定(データ値≦10:Yates補正、データ値≦3:Fisher直接確率)、残差分析 |
|
順序尺度 |
|
Wilcoxon (Mann-Whitney U), Kolnogorov-Smirnov, Watson |
|
|
|
有意差が認められた時は、更に、2区分に分けて、χ2検定を繰り返す、残差分析 |
質的デ−タ、3群間≦ |
2区分(クラスター) |
|
χ2検定(データ値≦10:Yates補正)、残差分析 |
|
|
対照群との比較 |
Wilcoxon |
|
名義変数で3区分以上 |
|
χ2検定(データ値≦10:Yates補正、データ値≦3:Fisher直接確率)、残差分析 |
|
順序尺度 |
|
Kruskal-Wallis |
|
|
|
有意差が認められた時は、更に、Wilcoxon順位和による多重比較により、差異群を見つける |
量と質、2群間 |
量的と名義 |
|
平均値の差の検定 |
量的デ-タ、2群間 |
パラメトリック(正規性・等分散) |
|
(対応のない)2標本t検定 |
|
ノンパラメトリック(正規性あり、等分散なし) |
|
Welch |
|
ノンパラメトリック(正規性も仮定できない、標本数が少ない) |
|
Wilcoxon順位和、Mann-Whitney U, 中央値検定(Median test) |
|
裾広がり(尖度) |
|
変数変換後、正規分布近似としてから、検討すること(とても重要) |
量的デ-タ、3群≦ |
群間の比較:3地区間での住民のHb差 |
パラメトリック(正規性・等分散)、サンプル数が等しい |
(対応のない)一元配置分散分析(1-way ANOVA) |
|
|
|
有意時、Bonferroniで差異群を検出 |
|
|
|
直接2群の比較を繰り返す(多重比較法post hoc test)Tukeyで、差異群を検出 |
|
|
ノンパラメトリック(正規性・等分散無し)、サンプル数が不等 |
Kruskal-Wallis (分散分析ではない) |
|
|
|
有意時、Wilcoxonで差異群確認 |
|
|
|
直接2群の比較を繰り返す(多重比較法)Scheffe, Steel-Dwassで、差異群を検出 |
|
対照群と比較 |
正規性・等分散、サンプル数が等しい |
Dunnett |
|
|
正規性・等分散無し、サンプル数が不等 |
Wilcoxon |
|
|
|
(多重比較法)Scheffe, Steelで、差異群を検出 |
|
群別に順序尺度が想定でき、単調反応としての用量反応関係を検討 |
|
Jonckheere |
|
|
x(用量、順位尺度)とy(反応、平均値)を適当に変換して、 |
回帰分析を行い、傾きの検定 |
|
|
x(用量、順位尺度)とy(反応、平均値)を適当に変換して、 |
Spearman順位相関係数、Kendall順位相関係数 |
実際の、統計処理の手順(4):比較、交絡因子を考慮して
適応
群同士で、年令・性・関連事項の分布が等しい(マッチング)こと:すなわち、バイアスの1つである、交絡因子が取り除かれていない:
無作為割付でないとき:
マッチングしていないか、諸条件について、その分布を比較しないとき
更に、デ−タ自体の正規性についても確認し:
群ごとの正規性(または症例数(25〜)30≦で代用)・等分散によるパラメトリックの採用、非正規性または質的変数におけるノンパラメトリイクの採用
単一の交絡因子の変数を調整 |
複数群において各一群に交絡因子xとyの組み合わせた多数ある場合、各群のyにおける比較 |
xyグラフ上、各群におけるxyの関係が平行であることが必要条件である。 |
例:世界各国群における、y=出生体重とx=母体年齢(交絡因子)について、各国群の出生体重を比較したい場合、グラフに各国群のxyグラフを作図しxyが平行であることを確認で切れば、各群別の出生体重の一元配置分散分析として検定できる |
共分散分析(ANCOVA) |
|
基準変数が分類尺度(あり、なし)で、説明変数の1変数が交絡因子 |
例:y=発症あり1、なし0、説明変数の1つx1=曝露あり1、なし0、説明変数の内の1つの交絡因子=素因あり1、なし0 |
例:説明変数の1つx2の交絡因子を調整して、Y=発症の有無と説明変数の1つx1=曝露の有無を検定。説明変数が多数の場合、説明変数の項目を替えたり、交絡因子の項目をかえたりして、検定を繰り返す。 |
Logistic |
交絡因子を区分(クラスタ−化、細分類)して使用 |
単一または複数の交絡因子で、細分類(層別化)での比較 |
例1. まず大きく2群にわけて検討、例2. 年令のみの交絡因子: 年代にクラスタ−分類して比較。 例3. 複数の交絡因子: 年代と性と曝露を組み合わせた群で比較 |
例3. 年代2と性2と曝露2で8層として比較:若年男性曝露、若年男性非曝露、若年女性曝露、成人女性非曝露、等に分割設定して、比較 |
層別解析(層別化) |
(ダミー、カテゴリー化操作自体がバイアスとなりうることに注意) |
単一の交絡因子を細分類(層別化)し、2x2四分表でオッズ比・χ2乗の比較 |
例. 曝露と発症において、一定の性差が見られる(性が交絡因子) |
例. 2x2四分表(曝露と発症)を、男女(または弱老)別に分けて検討しオッズ比が等しいとき、分割因子に交絡ありとし、単純併合すると誤った検定となることが予測される (Breslow-Day検定) |
Mantel-Haenszel χ2乗検定(併合による調整を考慮した検定) |
|
2要因の交絡因子を細分類(層別化)での比較 |
要因としての2つの交絡因子をカテゴリ−化し、対象分析変数を検討する |
例: 交絡因子の2要因の量的データ(年令と体重)をクラスタ−区分し、この2要因の量的データの最高血圧データへの影響を解析する。注意: 正規分布、等分散を必要条件とする。 |
二元配置分散分析(2-way ANOVA)+多重比較(post hoc test) |
|
多変量解析で切り抜ける |
予測:質的 |
説明変数:質的 |
数量化2類 |
|
|
|
説明変数:量的 |
判別分析 |
|
|
|
説明変数:質的と量的な交絡因子が混在 |
条件付多重Logistic モデル |
|
|
予測:量的 |
説明変数:質的な交絡因子 |
数量化1類 |
|
|
|
説明変数:量的な交絡因子 |
重回帰分析:目的変数をダミ−変数として |
|
|
|
説明変数:質的と量的な交絡因子が混在 |
数量化1類:量的デ-タをカテゴリ−化して |
|
|
|
|
重回帰分析:質的デ-タをダミ−変数として |
ダミ−変数(数量化):順序尺度(中間順序)、分類尺度(対象=1、対象外=0。または、上記の対照群を替えて、反復する)
実際の、統計処理の手順(5):関係(相関と関連)
2変数 |
両方が量的デ−タのみ |
まず最初に検討すべきこと |
基礎統計量、ヒストグラム、散布図、散布図 |
|
|
|
|
検定 |
パラメトリック(正規性) |
直線検討 |
Peason積率相関係数(単相関係数)+無相関検定+Fisher z変換による母相関係数の信頼区間の推定 |
|
|
|
|
予測 |
回帰分析 |
|
|
|
|
曲線、単調関係 |
順位デ-タはSpearman順位相関係数、大小関係のみのデ-タはKendall順位相関係数(タイは修正する)、+無相関検定+Fisher z変換による母相関係数の信頼区間の推定 |
|
|
|
ノンパラメトリック(正規性で無い) |
曲線、単調関係 |
順位デ-タはSpearman順位相関係数、大小関係のみのデ-タはKendall順位相関係数(タイは修正する)、+無相関検定+Fisher z変換による母相関係数の信頼区間の推定 |
|
1方が量的デ−タで、他方が質的デ-タ |
質的デ-タの各カテゴリ−を群と考え |
|
|
群間の比較を参照実施 |
|
|
量的デ-タをカテゴリ−し、順序尺度と考え |
|
|
両者とも質的デ−タとしての群間の比較を参照実施 |
|
両方とも質的デ−タのみ |
順序尺度 |
|
|
順位デ-タはSpearman順位相関係数、大小関係のみのデ-タはKendall順位相関係数(タイは修正する)、+無相関検定+Fisher z変換による母相関係数の信頼区間の推定 |
|
|
名義尺度 |
|
|
χ2検定、残差分析 |
|
|
|
2x2クロス表 |
|
φ係数 |
|
|
一方が順序尺度でカテゴリ−数が3以上 |
|
|
群間の比較で、質的デ-タで比較したいを参照 |
1つの目的変数と複数の説明変数 |
目的変数 |
量的デ−タ |
説明変数 |
量的デ−タ |
重回帰分析 |
|
|
|
|
質的デ−タ混在 |
数量化1類 |
|
|
質的デ-タ |
|
質的デ-タ |
数量化2類 |
|
|
|
|
量的デ-タ混在 |
Mantel-Haenszel、条件付多重Logistic モデル、判別分析、数量化2類 |
|
|
|
交絡因子を調整 |
例: 変数(曝露など)と、カテゴリ-化された交絡因子(素因あり:1、素因なし:0)除外による、カテゴリ-化された目的変数(発症:1、未発症:0)への影響を検討 |
Logistic回帰 |
|
|
|
|
交絡因子を調整(除外)して、相関を調べる |
偏相関係数 |
|
|
|
|
交絡因子をそのまま「共変量」として加えて、主効果と共に分散分析する |
共分散分析 |
複数の変数間の関連を一度に観察したい |
|
量的データ |
|
量的データ |
正準相関分析 |
|
複数の変数を少数の複合指標に縮約 |
|
|
|
主成分分析、数量化3類 |
|
変数に潜む少数の因子の構造を把握 |
|
|
|
因子分析、潜在構造分析 |
|
変数を似たもの同士に分類 |
|
|
|
主成分分析、Cluster分析、数量化3類、4類 |
複数の変数間の因果モデル |
変数の因果関係や相互関係を図示 |
|
|
|
共分散構造分析:多変量解析(重回帰分析、因子分析、判別分析)によるAmosプログラム(SPSSソフト)によるパス図 (path diagram)描写 |
|
注意 |
相関 |
correlation:変数が間隔変数・順序変数の場合の呼称。 |
|
|
|
|
関連・連関 |
association:変数が分類尺度の場合の呼称。 |
|
|
|
|
相関関係の強さ |
相関係数 |
0.2〜0.4 |
軽度 |
|
|
|
|
0.4〜0.7 |
中等度 |
|
|
|
|
0.7〜1.0 |
高度 |
|
実際の、統計処理の手順(6):多変量解析:予測、説明、判別
目的変数 y |
|
説明変数 x (多数) |
|
検定法 |
量的デ−タ |
正規性 |
量的デ-タのみ |
線形関係 |
重回帰分析 |
|
|
量的デ-タと質的デ-タ混在 |
量的デ-タをカテゴリ−化する |
数量化1類 |
|
|
|
質的デ-タをダミ−変数とする |
重回帰分析、共分散分析 |
|
|
質的デ-タ |
|
数量化1類 |
質的デ-タ |
|
量的データ |
|
判別分析 |
|
|
質的データ |
|
数量化2類 |
|
実際の、統計処理の手順(7):多変量解析:より少ない成分に要約、整理、圧縮
目的 |
|
検定法 |
総合指標に要約 |
量的変数 |
主成分分析 |
|
質的変数 |
数量化3類 |
少数の潜在的因子による構造の把握 |
|
因子分析 |
似たもの同士に分類 |
|
Cluster分析 |
|
実際の、統計処理の手順(8):生存時間分析、打ち切りデ−タを含む解析
群ごとのグラフ作成 |
生存期間、(回復期間) |
50≦症例数 |
生命表法 |
|
|
症例数<50 |
Kaplan-Meier |
検定 |
説明変数の数 |
1種類 |
Log-rank (一様性の検定) |
|
|
複数 |
Cox比例hazard model(Cox回帰モデル)、指数Weibull model、多重Logistic分析 |
|
実際の、統計処理の手順(9):分散分析(ANalysis Of Variance, ANOVA)、実験計画法で頻繁に応用
必要条件
等分散性(統計ソフトSPSS:ルビーン検定)。その為に、変数変換が必要になりうる。
特徴、および、検定の手順
1. 3群以上の水準間の平均値に差が有るか否かを同時に検定する:
手技:測定値全体の平均値からの変動(分散)=独立変数(要因)の効果に基づく変動+要因のカテゴリー(水準) 内での偶然の変動、すなわち、測定値の分散=要因で説明できる分散+要因では説明できない分散多群の比較を1回で実施することにより、2群ごとの比較の反復による有意水準の増加を抑制する
2. 主効果:各独立変数(要因)の従属変数への単独の影響
3. 交互作用:因子Aと因子Bが組み合わさったとき、因子Aと因子Bの単純な相加効果ではなく、相乗的または予想外の影響を示すこと。重要なのは、交互作用の有無により、その後の対応が異なるので注意すること。
その存在を折れ線グラフ上での非平行性により、グラフ上で交互作用の存在を確認できる。
二元配置では、二元配置ANOVAのコンピューター出力表の2因子間のAXB交互作用検定統計量F値が有意水準α=0.05の棄却域であれば帰無仮説Hoを棄却し有意差ありとする。他方、F値が有意水準α=0.05の棄却域に入っていない(=帰無仮説Hoを棄却できない=交互作用は存在しない)場合には、単独因子AまたはBにおける各因子内での水準間の差の検定に意義が有るので、各因子のF値が棄却域の場合は、多重比較を行い、どの水準間に差があるかを調べる。
4. 分散分析による全体的な検定後、多重比較(post hoc test)により、具体的にどの水準の間に有意差があるかを同定する:
(1) 等分散性が成立した時:
Bonferroni, Tukey's HSD, Sidak's t, Hochberg's GT 2, Gabriel's
pairwise comparison, Dunnett's pairwise multiple compariosn t, REGW
(2) 等分散性が成立しない時:
Tamhane's T 2, Dunnett's T3, Games-Howell pairwise comparison,
Dunnett's C
5. 交絡因子に注意
ある結果に対して複数の原因AとBが考えられるとき、どちらの原因が真の原因か明瞭に出来ない場合、AとBは交絡(confound)していると呼ばれる。しばしば、性別、年令、喫煙が交絡因子となり、あたかも、有意差を生じさせる原因となる。
分類
パラメトリック |
|
|
|
|
|
ノンパラメトリック |
|
要因数 |
第1要因 |
第2要因 |
第3要因 |
繰り返し:Exel分析ツ-ル |
(分散分析でない) |
一元配置 |
1要因 |
間、無 |
|
|
|
Kruskal-Wallis |
|
|
内、有 |
|
|
|
二元配置 |
2要因 |
間、無 |
間、無 |
|
あり |
Friedman |
|
|
間、無 |
内、有 |
|
|
|
|
内、有 |
内、有 |
|
|
三元配置 |
3要因 |
間、無 |
間、無 |
間、無 |
|
|
|
間、無 |
間、無 |
内、有 |
|
|
|
間、無 |
内、有 |
内、有 |
|
|
|
内、有 |
内、有 |
内、有 |
|
|
内:被験者内要因、間:被験者間要因、有:対応あり、無:対応なし
事例説明
ANOVA (9)−A.一元配置(1要因)
ANOVA (9)−A-1.一元配置(1要因)、被験者間要因・対応なし
例 12症例を3群に分けて、1要因(治験薬A)を3水準(1mg, 2mg, 3mg)に分けて投与し、各水準間でのデ−タ平均値を比較する。この場合、要因は被験者の全体の間に3水準として分散している。すなわち、各症例がそれぞれ全ての水準を含んでいない。
ソフト 通常の検定ソフト:一元配置分散分析、岡本の無料ソフト:被験者間1要因、SPSS:通常の一元配置分散分析(1要因、被験者間要因(被験者間計画))
表
症例 |
要因1 |
デ−タ |
|
要因1 |
1mg |
2mg |
3mg |
1 |
1mg |
data1 |
|
デ−タ |
data1 |
data5 |
data9 |
2 |
1mg |
data2 |
|
|
data2 |
data6 |
data10 |
3 |
1mg |
data3 |
|
|
data3 |
data7 |
data11 |
4 |
1mg |
data4 |
|
|
data4 |
data8 |
data12 |
5 |
2mg |
data5 |
|
|
|
|
6 |
2mg |
data6 |
|
|
|
|
7 |
2mg |
data7 |
|
|
|
|
8 |
2mg |
data8 |
|
|
|
|
9 |
3mg |
data9 |
|
|
|
|
10 |
3mg |
data10 |
|
|
|
|
11 |
3mg |
data11 |
|
|
|
|
12 |
3mg |
data12 |
|
|
|
|
|
ANOVA(9)−A-2.一元配置(1要因)、被験者内要因・対応あり
例 4症例において、全ての症例について1要因(治験薬A)を3水準(1mg, 2mg, 3mg)に分けた投与を実施し、各水準間でのデ−タ平均値を比較する。この場合、各症例がそれぞれ1要因の全ての水準を含んでいる。
ソフト 岡本の無料ソフト:被験者内1要因、SPSS:一般線形モデル+反復測定+被験者内因子名"A薬"+水準"3"(一元配置分散分析(1要因、被験者内要因 (被験者内計画))
表
|
要因1 |
|
症例 |
1mg |
2mg |
3mg |
1 |
data1 |
data2 |
data3 |
2 |
data4 |
data5 |
data6 |
3 |
data7 |
data8 |
data9 |
4 |
data10 |
data11 |
data12 |
|
注意 市原清志は二元配置に扱う、すなわち、第1要因(A薬)の3水準(1mg, 2mg, 3mg)投与条件と、第2要因(症例)の4水準(4症例)とみなして、2要因(投与量と症例)の分散分析と見なしている。通常の、二元配置分散分析ソフトしかない場合は、市原の考えに従わざるを得ない。
A |
症例 |
データ |
1mg |
1 |
data1 |
|
2 |
data2 |
|
3 |
data3 |
|
4 |
data4 |
2mg |
1 |
data5 |
|
2 |
data6 |
|
3 |
data7 |
|
4 |
data8 |
3mg |
1 |
data9 |
|
2 |
data10 |
|
3 |
data11 |
|
4 |
data12 |
|
ANOVA (9)−B.二元配置(2要因)
ANOVA (9)−B-1.二元配置(2要因)、被験者間要因・対応なし、(反復無し)
例 12症例を3群に分けて、第1要因(治験薬A)を3水準(1mg, 2mg, 3mg)に当て、さらに、各水準において、第2要因(治療薬B)を2水準(4mg,
5mg)を当てる。そして、第1因子の3水準と第2因子の2水準の間での平均値を比較する。この場合、2つの要因は被験者の全体の間に分散している。すなわち、各症例がそれぞれ全ての水準を含んでいない。各条件は単一のデ−タのみしかない(反復検査はしない)。
ソフト 通常の検定ソフト:繰り返しのないニ元配置分散分析、岡本の無料ソフト:被験者間2要因、SPSS:一般線形モデル+1変量(2元配置分散分析(2要因、どちらも被験者間要因(被験者間計画))
症例 |
要因1 |
要因2 |
デ−タ |
|
要因1 |
1mg |
|
2mg |
|
3mg |
1 |
1mg |
4mg |
data1 |
|
要因2 |
4mg |
5mg |
4mg |
5mg |
4mg |
5mg |
2 |
1mg |
5mg |
data2 |
|
デ−タ |
data1 |
data2 |
data3 |
data4 |
data5 |
data6 |
3 |
2mg |
4mg |
data3 |
|
|
|
|
|
|
|
4 |
2mg |
5mg |
data4 |
|
|
|
|
|
|
|
5 |
3mg |
4mg |
data5 |
|
|
|
|
|
|
|
6 |
3mg |
5mg |
data6 |
|
|
|
|
|
|
|
|
ANOVA (9)−B-2.二元配置(2要因)、被験者間要因・対応なし、(反復有り)
例 12症例を3群に分けて、第1要因(治験薬A)を3水準(1mg, 2mg, 3mg)に当て、さらに、各水準において、第2要因(治療薬B)を2水準(4mg,
5mg)を当てる。そして、第1因子の3水準と第2因子の2水準の間での平均値を比較する。この場合、2つの要因は被験者の全体の間に分散している。すなわち、各症例がそれぞれ全ての水準を含んでいない。各条件は複数のデ−タ(反復)を持つ。
ソフト 通常の検定ソフト:繰り返しの有るニ元配置分散分析、岡本の無料ソフト:被験者間2要因、SPSS:一般線形モデル+1変量(2元配置分散分析(2要因、どちらも被験者間要因(被験者間計画))
症例 |
要因1 |
要因2 |
デ−タ |
|
要因1 |
1mg |
|
2mg |
|
3mg |
1 |
1mg |
4mg |
data1 |
|
要因2 |
4mg |
5mg |
4mg |
5mg |
4mg |
5mg |
2 |
1mg |
4mg |
data2 |
|
デ−タ |
data1 |
data3 |
data5 |
data7 |
data9 |
data11 |
3 |
1mg |
5mg |
data3 |
|
|
data2 |
data4 |
data6 |
data8 |
data10 |
data12 |
4 |
1mg |
5mg |
data4 |
|
|
|
|
|
|
|
5 |
2mg |
4mg |
data5 |
|
|
|
|
|
|
|
6 |
2mg |
4mg |
data6 |
|
|
|
|
|
|
|
7 |
2mg |
5mg |
data7 |
|
|
|
|
|
|
|
8 |
2mg |
5mg |
data8 |
|
|
|
|
|
|
|
9 |
3mg |
4mg |
data9 |
|
|
|
|
|
|
|
10 |
3mg |
4mg |
data10 |
|
|
|
|
|
|
|
11 |
3mg |
5mg |
data11 |
|
|
|
|
|
|
|
12 |
3mg |
5mg |
data12 |
|
|
|
|
|
|
|
|
ANOVA (9)−B-3.二元配置(2要因)、被験者間要因・対応なしx被験者内要因・対応あり、(反復無し)
例 4症例はそれぞれ第1要因(A薬)の3水準(1mg, 2mg, 3mg)全てを施行される。また、4症例は第2要因(B薬)の2水準(4mg,
5mg)に2分される。第2要因は、各症例全てに実施されず、全症例の間で共有され分割される。このときの、第1要因(A薬)3水準と第2要因(B薬)2水準を比較する。
ソフト 岡本の無料ソフト:被験者間1要因+被験者内1要因、SPSS:一般線形モデル+反復測定+被験者内因子名"A薬"+水準"3"+被験者間因子名"B薬"+水準"2"(ニ元配置分散分析 (2要因、被験者間1要因+被験者内1要因(混合計画))
|
|
要因1 |
|
症例 |
要因2 |
1mg |
2mg |
3mg |
1 |
4mg |
data1 |
data2 |
data3 |
2 |
5mg |
data4 |
data5 |
data6 |
|
ANOVA (9)−B-4.二元配置(2要因)、被験者内要因・対応ありx被験者内要因・対応あり
例 4症例はそれぞれ第1要因(A薬)の3水準(1mg, 2mg, 3mg)全てを施行され、また、同様に、4症例は第2要因(B薬)の2水準(4mg,
5mg)も施行される。2つの要因はいずれも各症例全てに実施される。このときの、第1要因(A薬)3水準と第2要因(B薬)2水準を比較する。
ソフト 岡本の無料ソフト:被験者内2要因
症例 |
要因1 |
1mg |
|
2mg |
|
3mg |
|
要因2 |
4mg |
5mg |
4mg |
5mg |
4mg |
5mg |
1 |
|
data1 |
data2 |
data3 |
data4 |
data5 |
data6 |
2 |
|
data7 |
data8 |
data9 |
data10 |
data11 |
data12 |
3 |
|
data13 |
data14 |
data15 |
data16 |
data17 |
data18 |
4 |
|
data19 |
data20 |
data21 |
data22 |
dta23 |
data24 |
|
ANOVA (9)−C.三元配置(3要因)
要因1 |
条件A |
|
|
|
条件B |
|
|
要因2 |
条件a |
|
条件b |
|
条件a |
|
条件b |
要因3 |
条件1 |
条件2 |
条件1 |
条件2 |
条件1 |
条件2 |
条件1 |
条件2 |
デ−タ |
data 1 |
data 2 |
data 3 |
data 4 |
data 5 |
data 6 |
data 7 |
data 8 |
|
|
処理水準のデータの対応の有無による分類 |
|
|
要因1 |
対応無し(被験者間) |
対応無し(被験者間) |
対応無し(被験者間) |
対応有り(被験者内) |
要因2 |
対応無し(被験者間) |
対応無し(被験者間) |
対応有り(被験者内) |
対応有り(被験者内) |
要因3 |
対応無し(被験者間) |
対応有り(被験者内) |
対応有り(被験者内) |
対応有り(被験者内) |
デ−タ |
* |
* |
* |
* |
|
実際の、統計処理の手順(10):変数から見た検定法の選択
y
従属変数
規準変数 |
x
独立変数、説明変数 |
選択すべき検定法 |
|
数 |
無し |
量 |
1 |
平均値、分散 |
2 |
相関係数 |
3以上 |
Cluster分析、主成分分析、因子分析、数量化4類 |
質 |
1 |
比率 |
2 |
クロス表(独立性の検定) |
3以上 |
数量化3類 |
量 |
量 |
1 |
単回帰分析(相関係数) |
複数 |
重回帰分析、正準相関分析 |
質 |
1 |
一元配置分散分析、差の検定 |
複数 |
数量化1類 |
質 |
量 |
1 |
差の検定、分散分析 |
複数 |
判別分析、多重Logisticモデル、条件付多重Logisticモデル、Cox比例hazardモデル |
質 |
1 |
クロス表(一様性の検定) |
複数 |
数量化2類、Logisticモデル |
統計処理上、注意すべきバイアスについて:
分類 |
|
|
予防 |
|
|
偶然誤差、非系統誤差 random error |
|
偶然による。無作為抽出の場合の誤差。標本の偏りは偶然誤差+系統誤差。 |
|
標本数を増やす |
|
系統誤差、偏り、バイアス bias |
交絡バイアス confounding bias |
性、年齢、喫煙などが交絡因子となりやすい |
研究デザイン、サンプリング |
無作為化 randomization, random allocation |
|
|
|
初発症状バイアス protopathic b |
|
マッチング matching |
|
|
|
|
|
限定 restriction |
|
|
|
|
解析方法 |
層化 stratification, 層別解析 stratified analysis |
|
|
|
|
|
Mantel Haenszel法 |
|
|
|
|
|
標準化 |
直接法 |
|
|
|
|
|
間接法 |
|
|
|
|
多変量解析 |
比例ハザ-ドモデル |
|
|
|
|
|
Logistic回帰分析 |
|
選択バイアス selection b.: 研究対象に選択されたものと、選択されなかったものとの間に見られる特性の差によって生じる系統的な誤差。 |
標本の偏り、調査漏れ、健康労働者効果 healthy worker effect:就労者は元来元気 |
|
|
|
|
|
標本抽出バイアス sampling bias:全構成員から無作為に抽出することが大切 |
|
|
|
|
|
罹患率と有病率との違いに基づくバイアス、罹患率バイアス prevalence bias、発生率バイアス incidence bias、有病者・罹患者バイアス prevalence-incidnece b., Neyman b.: 早い時期に曝露を受けた者を後で振り返って観察する場合、早期死亡者や軽ケース,無症状例などが脱落することがあり、これがもとで起こるバイアス。現在の発症症例において、対象期間中において、過去低曝露は治癒し高曝露は死亡してしまう為、過去症例のうち治癒・死亡症例は抜け落ちる。10年目の罹患率(罹患者50/調査対象数750=0.07)ではその間の10年間の当該死亡者(250/1000)は算定されないので、10年間のコホ−ト研究のような10年間での罹患総数(300/1000=0.3)の検討と異なった結果が得られる。症例対照研究 |
cohort |
|
|
|
|
入院率バイアス admission rate b., Berkson b.: 入院を頻繁に繰り返す喫煙者・結核患者はしばしば精査を受けるので肺癌を早期に発見されやすい傾向があり、一見、非喫煙者・非結核合併群の肺癌患者よりも、その予後のオッズ比は下がる。本来は、結核合併肺癌の予後はより不良であるのに。 |
|
|
|
|
|
診断バイアス diagnostic suspicion b.: 曝露者を特定疾患と診断しやすい医者により、オッズ比が上がる。曝露者を安易に診断する。コホ−ト |
|
|
|
|
|
非協力者バイアス non-respondent b. |
|
|
|
|
|
積極協力者バイアス volunteer b. |
|
|
|
|
|
メンバ−シップバイアス、所属集団によるバイアス membership bias、健康な労働者効果:労働者は一般に健康だから働けるのであるが、病人や老人を多く含む一般大衆を対象群として比較した場合、危険な環境で働く労働者群は一般大衆より生存率が高い結果となる。 |
|
|
|
|
|
自己選択バイアス self-selection b.: 自発的参加者と参加しなかったものとの差異。抽出者が曝露を隠蔽拒否したり、逆に、積極的に協力し早期に軽快したと錯覚する(Howthone ホ−ソ−ン効果)。また、健康教育で優秀な指導者に参加者が憧れて指導者の望む方向に感化されやすくなったり、治療で優秀な主治医の為に患者が何か役立ちたいと思う(Pigmalion ピグマリオン効果)。追従によるバイアス:調査者の気に入るような方向に、回答が変わるバイアス。 |
|
|
|
|
|
さらけ出し(発見徴候)バイアス unmasking b., detection signal b., detection suspicous b.: 曝露因子が特定疾患発症のみで無く、さまざまな症状を伴う場合、特定疾患罹患でなく随伴症状による曝露疑い症例が多くなり、オッズ比は高くなる |
|
|
|
|
|
発見バイアス(detection bias)疫学調査における症例の確認方法、診断方法、証明方法などによるバイアス。例えば、病院例は検査所見で診断を確認するのに対して、病院外の症例では同様の検査を実施しない場合があり、選択基準があいまいになります。 |
|
|
|
|
|
紹介バイアス referral bias |
|
|
|
|
|
処置選択バイアス procedure selection bias:無作為な治療法の割付がなされないとき |
|
|
|
|
|
脱落バイアス losses to follow up:検索対象からの脱落者が疾病の発生と関連する場合。 |
|
|
|
|
|
持続性によるバイアス(length bias)一方の集団に長期の罹病患者(最も長期間の生存者)を多く選び、他の集団では選ばれないために生ずるバイアス。新発生患者を対象とせずに有病患者を対象とするときにこのような偏りが生じることがあります。 |
|
|
|
|
|
時間差によるバイアス(lead-time bias)2群の集団を追跡するとき、両群が時間に関して厳密には比較可能な状態で研究が開始されないために生ずるバイアス。一群が他群に比べて、疾病の自然史の中で、早い時期に診断されるようなときにこのような誤差を生じます。 |
|
|
|
|
|
バークソンのバイアス(Berkson's bias)入院記録にもとづき、曝露と疾病の関係を分析しても、結果は正しくないというバイアス。過去の病院記録に基づく場合、研究対象となる標本は、「自らの意思で来院してきた患者」であり、研究結果を適用したい集団(母集団)から「無作為に選ばれた患者ではない」ことからバイアスが生じる事が知られています。 |
|
|
|
|
測定バイアスmeasurement b.、検出バイアス detection b.: 調査すべき変数に関して、対象者を不正確に測定することによる系統的な誤差。 |
測定感度不良によるバイアス insensitive-measure bias:骨密度減少を単純XPでは30%以上減少しないと判定できない場合、正確な判定には、より検出力の高い骨密度測定器に変更することが必要となる |
|
|
|
|
|
記憶バイアス、リコ-ルバイアス、想起バイアス(recall bias)過去の出来事や経験の記憶を想起するとき、その正確さと完全さが異なるために生ずるバイアス。例:白血病で死亡した子供を持つ母は、健康な子供を持つ母親よりも、その子供が胎内で曝露したエックス線診断の内容をよく記憶している。思いめぐらしによるバイアス:ケースは自分の疾病についていろいろ思いめぐらすので、思い出し方がコントロールとは異なることによるバイアス。 症例対照研究 |
|
|
|
|
|
思いめぐらしによるバイアス:ケースは自分の疾病についていろいろ思いめぐらすので、思い出し方がコントロールとは異なることによるバイアス。 |
|
|
|
|
|
記憶上のバイアス:ケースは何回も繰り返し尋ねられた経験があるのに対して、コントロールは始めて聞かれることによるバイアス。 |
|
|
|
|
|
曝露疑いバイアス exposure suspicion b.: 質問者が予断を持って質問する |
|
|
|
|
|
家族情報バイアス family infromation b.: ケースは家族の健康状態に詳しいため、家族歴情報をケースから聞く場合とコントロールから聞く場合とで差があるというバイアス。症例者は、家族内の同一疾病を気づきやすい |
|
|
|
|
|
診断バイアス、検出力バイアス detection bias、Will Rogers現象:早期診断可能診断機器の導入により、単に早期診断が向上した為による理由が、生存率向上に関して不等に過大評価される |
|
|
|
|
|
情報バイアス(information bias)曝露量と反応に関する情報の質(精度)が比較群の間で異なるために生ずるバイアス。比較群で異なる調査方法を使用する場合などに起こります。 |
|
|
|
|
|
報告バイアス(reporting bias)特定の情報が選択的に抑えられたり、表面化したりするバイアス。例えば、性行為感染症の既往歴。 |
|
|
|
|
|
移転バイアス transfer b. |
|
|
|
|
|
観察者バイアス、面接者バイアス observer b., interviewer b.面接者の意識的または無意識的な資料の選択によるバイアス。
真の値と観察者によって測定される値の間に生ずるバイアス。これは観察者間の測定のばらつきと同一観察者の異なった測定間のばらつきに分けることができます。 |
|
|
|
|
|
気づかいによるバイアス:対象者が思い悩んでいることを尋ねると、それについての情報が通常のレベルから変わるバイアス。 |
|
|
|
|
|
非認容によるバイアス:プライバシーの侵害や赤面させるような事項についての質問は拒否されたり、答えをはぐらかされてしまうバイアス。 |
|
|
|
|
|
要因予知によるバイアス:患者の症状についての知識があることによるバイアス |
|
|
|
|
|
数字の好みによるバイアス(bias due to digit preference)測定結果をある種の数にまとめようとする好みで生じるバイアス。最も近い整数、偶数、5または10の倍数などにまるめられるクセなど。判断者の判定:ツ反の値と陰性、偽陽性、陽性への割付の丸目の基準が診断者によって異なる。若手医師程、陽性率が高くなる。 |
|
|
|
|
|
施行バイアス performance b.、処置バイアス procedure bias (Feinstein): 対照群に比較して、治療該当群はより綿密に注意深く厳密な治療計画と追跡調査がなされる傾向がある |
|
|
|
|
|
コンプライアンスバイアス compliance bias:治療過程で、患者が勝手により副作用の無い楽で快適な治療に変更する |
|
|
|
|
|
出版バイアス publication bias:有意な結果レポ−トは有意差がないレポ−トよりも出版されやすい。大規模・有名施設の有意差なしの結果は、小規模・無名施設の有意差有り結果より出版されやすい。 |
|
|
|
|
|
精査バイアス、確認バイアス work-up b |
|
|
|
|
|
参照バイアス review b. |
|
|
|
|
|
罹病性バイアス susceptibility b. |
|
|
|
|
|
範囲バイアス spectrum b. |
|
|
|
|
|
リ−ドタイムバイアス lead time b. |
|
|
|
|
|
期間バイアス length b. |
|
|
|
|
|
診断基準バイアス(ascertainment bias)観察者によって、対象としている患者の基準(例、軽症、中等症、急性症)が異なるために生ずるバイアス。診断過程に生ずる系統的な誤差(患者の治療を行うものの文化、習慣、性格などによって決まる)をいうこともあります。 |
|
|
|
|
|
試薬、製品の影響 |
|
|
|
|
|
平均値への回帰現象:何事も長期的には平均値へ回帰するものであり、極端な値をとる一部の集団もそれなりに小さな正規分布を保っている。 |
|
|
|
統計処理上、注意すべき交絡 (confound)
ある結果Xに対して、2つの原因AとBば考えられ、どちらの原因が真の原因かはっきりしない時、AとBは交絡していると言う。どのようにしても、紛れ込んでしまうバイアスであり、対策は、最初に群間の分析変数以外の条件を同一にする(マッチング)か、解析をノンパラメトリックとする。
|